線性模型 - 分類(2) 邏輯回歸 Logistic Regression - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2018 iT 邦幫忙鐵人賽

DAY 14

AI & Machine Learning

機器學習你也可以 - 文組帶你手把手實做機器學習聖經系列第 14 篇

線性模型 - 分類(2) 邏輯回歸 Logistic Regression

2018鐵人賽

shortid

2018-01-01 16:40:51

4566 瀏覽

分享至

上一篇以無機率的方式介紹怎麼做一個簡單的分類，而我們現在介紹一些有機率想法在裡面的方式。

前一篇我們給一筆資料 x 他就告訴我是+1或是-1，進而告訴你預測是哪一個類別。而現在我們要做的是，我們也是拿到一筆資料 x，我們告訴你它屬於哪一個類別的機率是多少！

首先先介紹兩個函數

sigmoid function

它可以把一個任意的實數值變成0~1之間的值，當我們只有兩個類別的時候，一個類別機率就是用這個function表得，令一個類別就剩下的機率。
softmax function

分母是所有類別都要累加起來的意思，用式子這個來表達資料是第k個類別的機率

接著我們以二元分類為例來解釋。我們這邊要用的手法就如同之前的Regression，設計一個error function然後最小化。首先我們要定義error function，一般來說，error function會是 -log likelihood，就像之前提過的機率再探curve fitting裡面描述的。

所以這邊我先寫下likelihood

因此我們的error function可以寫成

這個error function被稱作cross entropy error